導讀:對于百度搜索引擎來說,蜘蛛黑洞特指網站通過極低的成本制造出大量參數(shù)過多,及內容雷同但具體參數(shù)不同的動態(tài)URL ,就像一個無限循環(huán)的“黑洞”將spider困住,Baiduspider浪費了大
發(fā)表日期:2019-06-05
文章編輯:興田科技
瀏覽次數(shù):12835
標簽:
對于百度搜索引擎來說,蜘蛛黑洞特指網站通過極低的成本制造出大量參數(shù)過多,及內容雷同但具體參數(shù)不同的動態(tài)URL ,就像一個無限循環(huán)的“黑洞”將spider困住,Baiduspider浪費了大量資源抓取的卻是無效網頁。
比如很多網站都有篩選功能,通過篩選功能產生的網頁經常會被搜索引擎大量抓取,而這其中很大一部分檢索價值不高,如“500-1000之間價格的租房”,首先網站(包括現(xiàn)實中)上基本沒有相關資源,其次站內用戶和搜索引擎用戶都沒有這種檢索習慣。這種網頁被搜索引擎大量抓取,只能是占用網站寶貴的抓取配額。那么該如何避免這種情況呢?
我們以北京某團購網站為例,看看該網站是如何利用robots巧妙避免這種蜘蛛黑洞的:
對于普通的篩選結果頁,該網站選擇使用靜態(tài)鏈接,如:http://bj.XXXXX.com/category/zizhucan/weigongcun
同樣是條件篩選結果頁,當用戶選擇不同排序條件后,會生成帶有不同參數(shù)的動態(tài)鏈接,而且即使是同一種排序條件(如:都是按銷量降序排列),生成的參數(shù)也都是不同的。如:http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek
http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c
對于該團購網來說,只讓搜索引擎抓取篩選結果頁就可以了,而各種帶參數(shù)的結果排序頁面則通過robots規(guī)則拒絕提供給搜索引擎。
robots.txt的文件用法中有這樣一條規(guī)則:Disallow: /*?* ,即禁止搜索引擎訪問網站中所有的動態(tài)頁面。該網站恰是通過這種方式,對Baiduspider優(yōu)先展示高質量頁面、屏蔽了低質量頁面,為Baiduspider提供了更友好的網站結構,避免了黑洞的形成。
上一篇:
暫無信息更多新聞
2020
關于網站建設,當搜索引擎的算法改變或者加強時,導致一些網站的某些關鍵字排名消失,一些管理員就說他們的網站消失了。實際上并非如此,在搜索引擎算法改變
View details
2020
關于網站建設,下面小編告訴大家怎樣來提高網站建設的權重? 1標題:確保網站每一個標題的唯一性也是網站優(yōu)化者必須注重的,只有唯一性才能給你的網站帶來
View details
2023
一個良好的網站設計和結構可以提高您在搜索引擎結果頁面上的排名。通過使用適當?shù)年P鍵詞和優(yōu)化技術,您的網站將在搜索引擎中更容易被發(fā)現(xiàn)。這將帶來更多的有機流量和潛在客戶,從而增加您的業(yè)務增長。
View details
2020
關于網站建設,科技是第一生產力,信息時代是技術的時代。誰主導了技術,誰就主導著未來社會的發(fā)展。到這里,應該說這些結論都有道理。但由于信息技術的代表
View details